تاریخ : چهار شنبه 25 مرداد 1391
نویسنده : hamidrezakhouri
مركز داده چیست؟

مركز داده یك انباره مركزی است كه (چه به صورت فیزیكی و چه به صورت مجازی) برای ذخیره سازی،مدیریت،توزیع داده ها و اطلاعات طبقه بندی شده حول انواع دانش یا وابسته به یك تجارت خاص به كار می رود. برای مثال NCDC یك مركز داده ی عمومی است كه بزرگترین آرشیو جهانی اطلاعات آب و هوای دنیا به شمار می رود. یك مركز داده ی خصوصی ممكن است درون یك سازمان قرار گرفته باشد یا به صورت یك عضو مجزا در خارج از آن قرار بگیرد.
به گفته خانم Carrie Higbie مدیر بازاریابی بخش كاربردهای شبكه ی جهانی در شركت سایمون،هر سازمانی یك مركز داده دارد،اگر چه شاید به آن اتاق سرور گفته شود یا حتی تنها یك كامپیوتر باشد كه در جایی از سازمان مخفی است. در برخی مواقع نیز مركز داده ممكن است مترادف با یك مركز عملیات شبكه (NOC ) در نظر گرفته شود. مكانی محافظت شده شامل یك سیستم خود مختار كه دائما” در حال مراقبت و ثبت رفتار سرور ،ترافیك وب و كارایی شبكه است.

 شركت سایمون در مقاله ای آورده است: اسم مركز داده معانی مختلفی را در اذهان افراد مختلف تداعی می كند. بعضی افراد فكر می كنند مركز داده مكانی برای قرارگیری سرورها است در حالی كه برخی افراد تصوری كاملا” متفاوت تر از یك مركز داده دارند. شاید در زمانی این یك تصور صحیح بود اما اكنون مراكز داده چیزی بیش از یك مكان امن برای سرویس دهنده هستند. امروزه با پیشرفت تكنولوژی و نحوه تعاملات جدید مبتنی بر اطلاعات و تجمع اطلاعات،این مفهوم تغییر كرده و به مكانی برای ذخیره سازی اطلاعات یك سازمان تبدیل شده است كه برای عملكرد صحیح یك سازمان ضروری هستند و عدم وجود این اطلاعات حیاتی به معنای نابودی سازمان است. برطبق آخرین تحقیقات موسسه Infonetics روی بازار مراكز داده ی آمریكایی شمالی،انتظار می رود خدمات و محصولات مراكز داده با افزایش 47 درصدی از مبلغ 6/10 میلیارد دلار در سال 2003 به مبلغ 6/15 میلیارد دلار در سال 2007 برسند.
مركز داده می تواند تا 50 در صد هزینه های فناوری اطلاعات یك سازمان را در بر بگیرد. كاربردهایی چون ERP ، e-commerce ،SCM ، CADCAM ،rich media ،B2B ،B2C و ... جزو اهم فعالیت های یك سازمان با زیر ساخت IT است. مراكز داده به طور ساده به دو مقوله تفكیك می شوند : - مراكز داده ی سازمانی CDC – مراكز داده ی اینترنتی IDC ، CDC ها اطلاعاتی را كه مربوط به شركت ها است نگهداری و راهبری می كنند در حالی كه IDC ها توسط ISP6 ها به عنوان محلی برای قرارگیری وب سایت ها یا سرویس های اینترنتی مانند e-mail ، FTP و ... مورد استفاده قرار می گیرند.

برای تعریف كمیته ی علمی همایش نقش مركز داده در توسعه ی فناوری ارتباطات و اطلاعات كشور مركز داده مكانی است:
با امنیت فیزیكی و الكترونیكی بالا،برخوردار از پهنای باند ارتباطی وسیع،متصل به شبكه های رایانه ای ملی یا جهانی ،با خدمات تمام وقت و در دسترس.
كه شامل انواع تجهیزات سخت افزاری (رایانه ها ،سوئیچ ها،مودم ها و ... ) و نرم افزاری ( پایگاه های داده،سرورها ،سیستم عامل و ...) پیشرفته بوده و از پشتیبانی و نگهداری حرفه ای و تمام وقت برخوردار است
و به پشتیبانی و ارایه خدمات مرتبط با اطلاعات و داده از قبیل خدمات ذخیره، نگهداری و بازیابی داده،خدمات ERP ،میزبانی خدمات اینترنتی ،میزبانی ارایه ی خدمات كاربردی (ASP ) ،میزبانی برون سپاری خدمات (Out-sourcing ) ، خدمات شبكه ی اختصاصی مجازی (VPN ) و غیره برای شركت های خصوصی یا دولتی می پردازد.
رویكرد مركز داده سه دوره ی تاریخی راپشت سر گذاشته است،مرحله ی مراكز داده ی متمركز كه با پیدایش رایانه های بزرگ اولیه آغاز شد،مرحله ی مراكز داده ی توزیع شده كه در دهه 80 میلادی و با پیدایش رایانه های شخصی شروع شد و مرحله ی تمركز مجدد كه اواخر دهه ی 90 و با توسعه ی شبكه های رایانه ای و اینترنت آغاز گردید . برخی از تعاریف زیر مربوط به دوران اول یا دوم هستند. تعریف جمعبندی فوق،مركز داده را در شرایط جاری و در دوره ی سوم توصیف می كند .

تعاریف مختلف مركز داده
به مراكزی مانند مركز پردازش كارت اعتباری بانك كه مكانی برای پردازش داده های الكترونیكی است مركز داده اطلاق می شود .
مركز داده انباره ی متمركزی برای ذخیره،مدیریت و توزیع داده و اطلاعاتی است كه این داده ها به حیطه ی مشخصی از دانش یا كاربرد تعلق دارند. مركز داده ممكن است دارای یك مركز عملیات شبكه ( NOC ) باشد كه دسترسی محدود و كنترل شده ای دارد و شامل سیستم های خودكار مراقبت از فعالیت های سرور،ترافیك وب و عملكرد شبكه بوده و كوچكترین اختلال را به مهندسین گزارش می كند و آن ها مشكلات احتمالی را قبل از وقوع مهار می كنند .

مجموعه ای از تجهیزات متمركز شده
محلی برای نگهداری یك یا چند محیط تولید و فرآوری (از قبیل كامپیوترهای سرور،تجهیزات اتصال شبكه،پایگاه های داده و كاربردها) كه توسط یك سازمان برای انجام پردازش های داده های كاربران آن سازمان به كار می رود .
مركز داده مجتمعی برای نگهداری سیستم های كامپیوتری حیاتی (ماموریت گرا) و اجزای مرتبط آن است. این مراكز معمولا” دارای كنترل های محیطی (تنظیم هوا،جلوگیری از آتش سوزی و غیره) ، تداركات برق پشتیبان و امنیت بالا می باشند. خدمات اینترنتی و میزبانی وب معمولا” محل حضور و ارایه ی خدمات وب خود را در مراكز داده قرار می دهند .
مجموعه ای از ابزارهای فوق امن و مقاوم در برابر خرابی كه تجهیزات مشتری در آن قرار میگیرد و به شبكه های ارتباطی متصل است. این ابزارها شامل سرورهای وب،سوئیچ ها،مسیریاب ها و مودم ها است. مركز داده از سایت های وب شركت ها پشتیبانی می كند و محلی برای ISP ها، ASP ها، شركت های میزبانی وب و ارایه كنندگان خدمات DSL است .

محل فیزیكی سیستم های رایانه ای بزرگ و پایگاه های داده
مركز خدمات اینترنت كه معمولا”‌توسط شخص ثالث ارایه می شود،شامل تجهیزات مرتبط با اینترنت برای استفاده ی سازمان ها و تشكیلات اقتصادی ،ISP ها ،ASP ها ، شركت های تجارت الكترونیك و سایر شركت ها است. مركز خدمات اینترنت معمولا” مكان برون سپاری،سرورها،میزبانی خدمات ، شبكه ی اختصاصی مجازی و سایر شبكه ها بوده و انواع خدمات انتقال اطلاعات را ارایه می كند .
مركز داده بخشی از سازمان یا شركت است كه شامل سیستم های رایانه ای و تجهیزات مرتبط می باشد. ورود داده ها و برنامه نویسی سازمان هم ممكن است در این محل انجام شود. همچنین یك مركز كنترل ، بر كارها نظارت می كند .
یا ساختمان امن و محافظت شده كه شامل انواع رایانه ها،سرورها،مسیریاب ها،شبكه،سوئیچ ها و تجهیزات و تخصص های لازم برای پشتیبانی از انبوه اطلاعات معتبر كه قابل دسترسی توسط كاربران گوناگون در اقصی نقاط جهان باشد .

مركز داده به عنوان انباره ی داده
امروزه ابزارهایی كه به كار می بریم مقادیر زیادی اطلاعات و داده تولید می كنند. پراكندگی این داده ها باعث می شود كه شركت هایی كه این داده ها را تولید كرده اند به سختی بتوانند آن ها را مدیریت كرده و از منافع آن بهره مند شوند. یك انباره داده جمع آوری و مركزیت دادن به این داده ها را چه از یك منبع یا چندین منبع در یك مكان واحد برعهده دارد . تجمع این داده ها در یك مكان متمركز امكان تحلیل و بررسی آن ها را برای یك كمپانی ساده تر كرده و شرایط مناسبی جهت یك تصمیم گیری هوشمندانه برای یك تجارت بزرگ فراهم می كند. تعداد زیادی از شركت ها از منافع انباره داده برای جمع آوری اطلاعاتی كه توسط پایگاههای داده ای مبتنی بر سیستم های پردازش لحظه ای تراكنش ها (OLTP ) یا دیگر برنامه ها تولید شده اند،استفاده می كنند. مقیاس پذیری كه از كنار هم قرار دادن این انباره های اطلاعات در یك مركز داده به وجود می آید بسیار قابل توجه و جذاب است. نیاز مبرم انباره های داده به فضای ذخیره سازی و قدرت پردازشی بالا،دقیقا مقوله هایی هستند كه یك مركز داده می تواند در اختیار شركت ها و با هزینه پایین تر قرار دهد .

مركز داده به عنوان LOB سازمان ها در هر اندازه ای و در هر زمینه ای در یك مقوله اشتراك دارند: همه آنها نیاز دارند كه پروسه های تجاری روزمره و معمول را به صورت خودكار در آورند. كارهایی مثل ورود درخواست ها، پرداخت ها، بدهی ها، تولید و پردازش ها اطلاعات،خروج درخواست ها،كارها و... . LOB8 ها در دو مقوله قابل تفكیك هستند یا عمودی و یا افقی هستند. LOB های عمودی آن هایی هستند كه در مقوله تجارت،ERP9 ،CRM10 ،انبار داده ها و مدیریت دانش می گنجند . توضیح هر كدام از این لغات نیاز به مقاله ای بسیار مفصل تر دارد. اما افقی ها آن هایی هستند كه در بخش سرویس دهی مانند سرویس های اقتصادی، خرید و فروش ،پزشكی و ... فعالند. بدیهی است كه ماهیت حیاتی اطلاعاتی كه دراین زمینه روی مركز داده ذخیره می شود نیا زمبرمی به فعالیت بی وفقه و تمام وقت وجود دارد،اتخاذ راه حل امنیتی بالا برای اطمینان از محافظت داده ها در مقابل حوادث ناخواسته و همچنین استفاده از پرسنل و متخصصین كاملا” مجرب را الزامی می سازد .

مركز داده به عنوان مركز گواهی هویت
در دنیای امروز امنیت به عنوان یكی از مهمترین مسائل خصوصا” در بحث تجارت الكترونیك مطرح است. در این میان مقبول ترین روش یعنی امضای دیجیتالی بهعنوان راه حلی عمومیت یافته و مطمئن،نیاز به مراكز صدور گواهینامه های دیجیتالی را ضروری می سازد. احراز هویت در تجارت الكترونیكی و یا سایز تعاولات الكترونیكی در سراسر دنیا توسط امضای دیجیتالی انجام می شود. یكی از مهمترین مراكز نگهداری گواهینامه های دیجیتالی،شركت Verisign در آمریكا است. از آن جایی كه ایران جزو لیست سیاه قرار دارد،امكان گرفتن مجوز و نمایندگی گواهینامه های دیجیتالی غیر ممكن است. از سوی دیگر وجود چنین مركزی به عنوان پایه و اساس تجارت الكتونیك برای نگهداری گواهینامه های دیجیتالی در كشور امری مهم است. خصوصا” به دلیل آنكه مركز داده ماهیتا” امن طراحی می شود،این مركز یك گزینه مثبت برای كاندید شدن به عنوان یك مركز نگهداری گواهینامه های دیجیتالی است .

مراكز طلاعات در آمریكا
دولت آمریكا به منظور ارتقای ضریب ایمنی مراكز اطلاعاتی ،بانك های اطلاعاتی و كارگزاران شبكه (Servers ) خود را در مكان های با امنیت بالا نگهداری می كند. بعضی از این اماكن محوطه های وسیعی در اعماق كوه ها ی راكی،در نقاط پنهانی از اعماق صحراهای نوادا و آریزونا،در زیر یخچال های آلاسكا و در اعماق اقیانوس ها می باشند. این نقاط با شدیدترین تدابیر امنیتی حفاظت می شوند از طرف دیگر پیش بینی های ایمنی تهدیدات فیزیكی ،از جمله آتش سوزی و بلایای طبیعی را به حداقل رسانده است. تجهیزات حفاظتی ،امكان دستبرد و یا آسیب هوشمندانه فیزیكی را كاهش داده است. در این اماكن خطوط متعدد فیبر نوری با پهنای باند بالا بالاترین سرعت انتقال داده و اطلاعات را تامین می كنند.
تجهیزات پرسرعت مانند سوپر كامپیوترها ( Main Frame ) و پردازنده های بسیار سریع و موازی بالاترین سرعت دسترسی را در اختیار می گذارند. سیستم های پیشرفته تنظیم دما و حرارت تنظیم رطوبت و كنترل تركیبات هوای محیط بهینه ترین شرایط را برای كار تجهیزات مهیا می سازند و تجهیزات مانیتورینگ دقیق، لحظه به لحظه وضعیت های مختلف را كنترل و بازنگری می كنند. بناهای مستحكم در اعماق زمین نه تنها توان تحمل شدید ترین زلزله ها را دارند، بلكه در مقابل قویترین بمب های هسته ای موجود آسیبی نمی بینند. سیستم های پشتیبان،از اطلاعات در فواصل زمانی مشخص بر طبق آخرین تكنیك های موجود نسخه های پشتیبان تهیه می كنند. ژنراتورها و مولدهای قوی برق (UPS ) ،آماده تامین نیروی برق لازم در صورت بروز اختلال می باشندو پوشش های مخصوص،تجهیزات را از تهدید امواج مختلف از قبیل امواج ماكروویو و یا میدان های الكترومغناطیسی خارجی یا تولید شده از خود تجهیزات محافظت می كنند. به هر یك از این مراكز،مركز داده ای (Data Center) گفته می شود. در كنار هر مركز داده ای دو مركز دیگر آماده ی انجام عملیات می باشند. یكی مركز بازیافت اطلاعات آسیب دیده ( Disaster Recovery Center ) است كه فعالیت های آن در قالب كلی بازیافت داده (Data Recovery) می گنجد كه خود مقوله ی بسیار مهمی است كه از ضروری ترین نیازهای هر ارگان و تشكل مرتبط با اطلاعات می باشد. مركز دوم مركز كنترل و فرمان است كه مدیریت انسانی مركز داده ای را به عهده دارد ،در این مركز افرادی با تخصص بالا و با دستمزدهای بسیار بالا كار می كنند. بانك های اطلاعاتی و سرورهای مربوط به زیر ساخت های این كشور از قبیل شبكه ی برق،آب و نیز اطلاعات شركت های دولتی یا خصوصی حساس مثل شركت های اسلحه سازی و یا اطلاعات بانك ها در این مراكز نگهداری می شود. ایده ی مركز داده (Data Center ) در سطوح پایین تر و با درجه حساسیت كمتر نیز پیاده شده است. به طوری كه امروزه شركت هایی وجود دارند كه با فراهم آوردن اماكنی كه بعضی از امتیازات فوق را دارند در ازای دریافت اجاره بها اطلاعات فردی یا سازمان ها را میزبانی می كنند و خدمات مورد نظر آن ها را با كیفیتی بسیار بهتر در اختیار مشتریان قرار می دهند. سایت های خارجی در چنین محیط هایی قرار داده شده اند.

به صورت خلاصه مزایای استفاده از مراكز داده عبارتند از :
امنیت فیزیكی بالا
امنیت الكترونیكی بالا
مقابله با افزونگی و تكرار اطلاعات
ارایه بالاترین سرعت پردازش در یك مكان
ارایه بالاترین سرعت انتقال اطلاعات
خرید تنها یك نسخه از نرم افزارها
پشتیبانی متمركز

اگر از مراكز داده استفاده نشود و هر سازمانی بانك اطلاعاتی خود را در شبكه داشته باشد،به تعداد سازمان ها نیاز به تیم پشتیبانی جداگانه،نرم افزار جداگانه،سخت افزار جداگانه،پهنای باند جداگانه،امنیت جداگانه و ... خواهیم داشت كه سرباز هزینه ای بالایی دارد. به نظر می رسد ایده ی Data Center به دلیل تامین كارایی و امنیت بالا و جلوگیری از افزونگی ،سهولت نگهداری و مدیریت و بسیاری جنبه های فنی دیگر،در تحقق اهدافی همچون دولت الكترونیكی ،ایده ای كارساز باشد .

برون سپاری و مراكز داده
یكی از مفاهیمی كه امروزه بسیار در صنعت IT شنیده می شود مفهومی به نام برون سپاری است. شاید با اندكی اهمال برون سپاری را بتوان به معنای تكثیر مركزیت یا سپردن كار به كاردان در نظر گرفت. امروزه با افزایش نگرانی در رابطه با افزایش هزینه ها در صنعت IT و فشار بازار رقابتی، تصمیم گیری در رابطه با برون سپاری به عنوان یك راه حل منطقی،برای شركت ها آسان تر شده است. آنچه باقی می ماند سوالاتی از قبیل مدیریت ارتباطات برون سپاری،افزایش كارایی در كنار كاهش هزینه ها و هر گونه تغییری است كه یك شركت باید در سازه و كار خود بدهد. مهمترین قسمت یك سازمان در صنعت IT همانا اطلاعات آن است. مركزیت این اطلاعات در مركز داده داخلی به عنوان قلب تپنده سازمان یا شركت و حجیم تر شدن روزمره این اطلاعات نیاز به مراكزی با كارایی و امنیت بالا و هزینه پایین برای ادامه حیات یك شركت،رابیش از پیش نمایان می سازد. حال سوال این است كه كجا برای این امر مناسب تر است؟ مراكز داده به صورت استراتژیك در موقعیت های مشخصی پخش شده و در مقابل نبود برق و بلایای طبیعی محافظت می شوند. همچنین دارای منابع اضافی برای تولید برق و پهنای باند بلا استفاده در شرایط اضطراری می باشند. به این ترتیب سازمان ها در اطراف جهان می توانند با خیال راحت برون سپاری خود را از طریق مراكز داده انجام دهند و از خدمات آن ها بدون نیاز به نگرانی از بابت مسائل جنبی مركز داده ی محلی خود نهایت استفاده را ببرند. همچنین آن ها می توانند با حدف این نگرانی ها توجه خود را هر چه بیشتر به مسائل تجارتی معطوف كنند و با افزایش كیفی خدمات خود سعی در نزدیكی هر چه بیشتر به نظرات مشتری و گام برداشتن در جهت ایجاد یك جو مشتری مدار داشته باشند. اما با تمام این تعاریف چرا هنوز مدیران حركت به سمت برون سپاری را آغاز نكرده اند یا به آن به دیده شك و دودلی می نگرند؟برخی از مدیران IT معتقدند مشكلات برون سپاری بیشتر از منافع آن است. مثلا” اگر به هر نحوی مشكلی در مركز داه ی اجاره ای یا خریداری شده آن ها در یك كشور دیگر به وجود بیاید،آن ها چگونه باید در این رابطه اقدام كنند؟یا اگر مشكلی در روابط كشورها به وجود بیاید چه اتفاقی می افتد؟ به طور كلی یك مجموعه مجتمع راحت تر مدیریت می شود. اما اگر قسمت مركزی آن به جای دیگری كه ارزان تر است منتقل شود،آیا هزینه های جانبی آن قابل پیش بینی خواهد بود؟نگهداری رابطه بین مركز اصلی و خارجی نیازمند یك برنامه اصولی است،آیا این هزینه و دیگر هزینه های پنهان ناشی از این مقوله باز هم اجرای آن را مقرون به صرفه نگه می دارد؟ آیا در نهادهای دولتی كه نیاز بسیار مبرمی به مقوله امنیت و به خصوص بحث امنیت ملی دارند اعتماد به یك طرف بیگانه امری عقلانی محسوب می شود؟این ها مقولاتی هستند كه تصمیم گیری نهایی در آن ها به عهده مدیران IT سازمان ها است. جایی كه آن ها معمولا باید پاسخگو باشند. برون سپاری در امر تولید سخت افزار كامپیوتر یا به خدمت گرفتن طراحان نرم افزار تا كنون منجر به نتایج خوبی برای كشورهای غربی شده است،اكنون به دلیل نیروی كارگران قیمت در آمریكا و دیگر كشورهای اروپایی،استفاده از نیروی كار ارزان و خبره كشورهایی مثل هند،پاكستان،مالزی و حتی در برخی مواقع ایران و صرفه جویی قابل توجه در پروسه تولید،توجه بسیاری از مدیران كشورهای غربی و به خصوص آمریكا را به خود جلب كرده است . نكته ی قابل توجه این است كه اگر چه برون سپاری به مراكز داده ی خارج كشور با مشكلات عدیده ای روبرو است،اما می توان با ایجاد مراكز داده ی ملی در داخل كشور بر این مشكلات فائق آمد .


|
امتیاز مطلب : 5
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1
موضوعات مرتبط: ▼ مقالات عمومی پایگاه داده , ,
تاریخ : چهار شنبه 25 مرداد 1391
نویسنده : hamidrezakhouri

در دههٔ ۱۹۷۰ كه پایگاه‎های اطلاعاتی درون خطی رواج یافتند پیش‎بینی می‎شد كه به زودی جایگزین منابع چاپی شوند. با ظهور دیسك‎های نوری این تصور پیش آمد كه آن‎ها نیز به نوبهٔ خود هم جای منابع چاپی و هم پایگاه‎های اطلاعاتی درون خطی را بگیرند. با وجود این, در حال حاضر هر سه رسانه در كنار هم به موجودیت خود ادامه می‎دهند. مهم‎ترین استفاده‎كنندگان از دیسك‎های نوری, كتابخانه‎های دانشگاهی هستند. در حالی كه كتابخانه‎های تخصصی استفاده از پایگاه‎های اطلاعاتی درون خطی را ترجیح می‎دهند.

تأثیر دیسك‎های نوری بر پایگاه‎های اطلاعاتی درون خطی

در دههٔ ۱۹۷۰ كه پایگاه‎های اطلاعاتی درون خطی رواج یافتند پیش‎بینی می‎شد كه به زودی جایگزین منابع چاپی شوند. با ظهور دیسك‎های نوری این تصور پیش آمد كه آن‎ها نیز به نوبهٔ خود هم جای منابع چاپی و هم پایگاه‎های اطلاعاتی درون خطی را بگیرند. با وجود این, در حال حاضر هر سه رسانه در كنار هم به موجودیت خود ادامه می‎دهند. مهم‎ترین استفاده‎كنندگان از دیسك‎های نوری, كتابخانه‎های دانشگاهی هستند. در حالی كه كتابخانه‎ها%D


|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
موضوعات مرتبط: ▼ مقالات عمومی پایگاه داده , ,
تاریخ : چهار شنبه 25 مرداد 1391
نویسنده : hamidrezakhouri

ذخیره و بازیابی اطلاعات

فعالیت‌هایی که برای تحلیل و سازماندهی مدارک و منابع صورت می‌گیرد ذخیره اطلاعات، و تلاش‌هایی که برای یافتن یک یا چند مدرک از میان انبوه مدارک ذخیره شده انجام می‌شود بازیابی اطلاعات نام دارد.

ذخیره و بازیابی اطلاعات

فعالیت‌هایی که برای تحلیل و سازماندهی مدارک و منابع صورت می‌گیرد ذخیره اطلاعات، و تلاش‌هایی که برای یافتن یک یا چند مدرک از میان انبوه مدارک ذخیره شده انجام می‌شود بازیابی اطلاعات نام دارد.

فعالیت‌هایی که برای تحلیل و سازماندهی مدارک و منابع صورت می‌گیرد ذخیره اطلاعات، و تلاش‌هایی که برای یافتن یک یا چند مدرک از میان انبوه مدارک ذخیره شده انجام می‌شود بازیابی اطلاعات نام دارد. نظام‌هایی که این جریان‌ها در آنها روی می‌دهد نظام‌های ذخیره و بازیابی اطلاعات خوانده می‌شود (۶۶۱:۵). نظام‌های ذخیره و بازیابی اطلاعات معمولاً به منظور دسترس‌پذیر کردن مجموعه‌ای از منابع اطلاعاتی برای استفاده‌کننده‌ای که مایل به کسب این اطلاعات است طراحی می‌گردد. اطلاعاتی که در نظام‌های ذخیره و بازیابی اطلاعات ذخیره می‌شود یا صرفاً شامل داده‌های کتابشناختی است، مانند مشخصات کتاب‌ها، اسناد و مدارک، و مقاله‌های مجلات؛ یا اصل مدرک است که همراه مشخصات آن عرضه می‌شود. حالت اخیر پایگاه داده‌های تمام متن نام دارد. نظام‌های بازیابی اطلاعات را در معنای وسیع می‌توان برای دستیابی به مجموعه‌های تصویری، فیلم، پروانه‌های ثبت اختراع، و جز آن نیز مورد استفاده قرار داد. در هر حال، هدف هر نظام ذخیره و بازیابی اطلاعات آن است که در اسرع وقت بیشترین اطلاعات مرتبط با نیاز استفاده‌کننده را ـ آن‌طور که در درخواست وی ذکر شده ـ در اختیار بگذارد.

 

 

● تاریخچه

تاریخچه ایجاد و گسترش نظام‌های بازیابی اطلاعات را می‌توان به چندین دوره نسبتاً روشن تقسیم کرد. قبل از سال‌های ۱۹۴۰ تهیه می‌شد، نظام‌های بازیابی اطلاعات تنها از نوع دستی محض بود، یعنی نمایه‌ها و فهرست‌ها به شکل چاپی و کارتی تهیه می‌شد. این وسایل بازیابی، پیش‌همارا و غیرقابل دستکاری است و متکی بر سازماندهی خطی (تک بعدی) بوده و قابلیت‌های بسیار محدودی برای جست‌وجو و بازیابی دارند. در سال‌های ۱۹۴۰، مهم‌ترین پیشرفت در تاریخچه بازیابی اطلاعات یعنی ابداع نظام‌های بازیابی که پس‌همارا و قابل دستکاری هستند روی داد. این نظام‌ها که هنوز عمدتاً دستی بودند توسط باتن و کوردونیر[۱] (پیکابو، یا تطابق نوری)، موئرز[۲] (برگه‌های منگنه‌ای)، و نیز توسط مورتیمر تاب[۳] (نظام تک واژه‌ای) عرضه شد. این نظام‌های پس‌همارای اولیه مزایای قابل توجهی نسبت به پیشینیان خود عرضه کردند. آنها نیای مسلّم نظام‌های رایانه‌ای نوین به حساب می‌آیند.

در سال‌های ۱۹۵۰ اشکال اولیه خودکارسازی نمایه‌سازی پس‌همارا توسط نظام‌های داده‌پردازی برگه منگنه پدید آمد. نظام‌های برگه منگنه در دهه ۱۹۵۰، در واقع، اسلاف بلافصل نظام‌های رایانه‌ای سال‌های ۱۹۶۰ بودند. سال‌های ۱۹۶۰ دوران بازیابی رایانه‌ای به شیوه گسسته، پردازش دسته‌ای و نواری را تشکیل می‌داد. در سال‌های ۱۹۷۰، با توسعه سخت‌افزارها و نرم‌افزارهای رایانه‌ای، امکان انجام جست‌وجوهای پیوسته یا تعاملی فراهم آمد. نظام‌های پیوسته بازیابی، علاوه بر افزایش سرعت، امکان دریافت بازخورد جست‌وجو در روند جست‌وجو و، در صورت لزوم، تغییر و اصلاح آن را به استفاده کننده می‌دادند. مهم‌ترین مزیت بازیابی پیوسته امکان دسترسی از راه دور بود. در این مورد شرکت‌های بزرگی چون دیالوگ و بی.آر.اس. در بخش خصوصی و کتابخانه ملی پزشکی در بخش دولتی، با عرضه نظام بازیابی مدلاین، فعالیت‌های فراوانی داشته‌اند. از ابتدای سال‌های ۱۹۸۰، توسعه و گسترش ذخیره و بازیابی اطلاعات به شکل متن کامل از جمله تحولات و رویدادهای مهمی است که شکل گرفته است. هر چند اندیشه‌ها و تلاش‌های مربوط به این شکل از ذخیره و بازیابی به سال‌های ،۱۹۷۰ زمان اولین تلاش‌ها برای واردکردن متون حقوقی در رایانه و جست‌وجوی آزاد بر روی آن متون، باز می‌گردد با ازدیاد رایانه‌های شخصی و پیدایش رسانه‌های ذخیره‌سازی نوری مانند دیسک فشرده و نیز رواج نشر رومیزی (دی.تی.پی.) بود که ایجاد پایگاه‌های تمام متن و نیز فنون بازیابی از متن عمومیت بیشتری یافت و در دسترس استفاده‌کنندگان قرار گرفت. بازیابی در این نوع نظام‌ها که عمدتاً مبتنی بر استفاده از زبان طبیعی است و از این لحاظ در مقابل نظام‌های مبتنی بر واژگان مهار شده قرار می‌گیرند دارای جذابیت‌های زیادی برای استفاده‌کنندگان از آنهاست، لکن برای بازدهی بیشتر از مزایای هر دو نظام به طور همزمان استفاده می‌شود.

در سال‌های اخیر، استفاده از فنون بصری جایگاه خاصی یافته و چالش‌های جدید و بحث‌های گسترده‌ای را به دنبال داشته است. استفاده از این فنون، به ویژه برای طراحی واسط‌های کاربر، باعث سهولت بیشتر در استفاده از نظام‌های بازیابی و فراگیرتر شدن دامنه استفاده از این نظام‌ها گردیده است.

 

 

● تحلیل و جست‌وجوی اطلاعات

بازیابی اطلاعات ممکن است به دلایل زیر باشد:

۱) حجم زیاد اطلاعاتی که می‌بایست دسترس‌پذیر گردد؛

۲) مشکلات فراهم آوردن ذخایر عظیم مواد و منابع به صورتی که بتوان به راحتی به آنها دست یافت؛

۳) افزایش مشکلات فنی ناشی از اشاعه گزینشی حجم زیاد منابع برای استفاده‌کنندگان ناهمگن (۶۶۱:۵).

در روند ذخیره و بازیابی اطلاعات دو مرحله متمایز تحلیل اطلاعات و جست‌وجوی اطلاعات را می‌توان مشخص ساخت.

 

 

● تحلیل اطلاعات

فرایند تعیین محتوای موضوعی مدارک و تبدیل آن به زبان نظام (یا مجموعه‌ای از اصطلاحات نمایه‌ای) را تحلیل اطلاعات گویند. در این مرحله، نمایه‌ساز یا کسی که کار تحلیل اطلاعات را انجام می‌دهد ابتدا باید، پس از پویش و تحلیل مفهومی مدرک، مشخص کند که مدرک درباره چیست و چه جنبه‌هایی را دربرمی‌گیرد. در نظر گرفتن نیازهای استفاده‌کننده نظام در این مرحله مسئله‌ای اساسی است. به عبارت دیگر، نمایه‌ساز نه تنها باید در مورد موضوع مدرک تصمیم‌گیری کند، بلکه باید متوجه باشد که چه جنبه‌هایی از مدرک می‌تواند برای استفاده‌کننده‌ای خاص حائز اهمیت باشد. گام بعدی، تبدیل نتیجه تحلیل مفهومی مدرک به مجموعه‌ای از اصطلاحات نمایه‌ای است. اصطلاحات نمایه‌ای ممکن است برگرفته از سیاهه‌ای مجاز از واژه‌ها (واژگان مهار شده) یا از متن مدرک و واژه‌های مؤلف باشد. شیوه دوم نمایه‌سازی با استفاده از زبان طبیعی است. در هر حال، حاصل کار، تعدادی اصطلاح است که، در مجموع، تصویری از موضوع مدرک را به دست می‌دهند و با نام‌های کلید واژه، سرعنوان موضوعی، توصیفگر، و نیز خوانده می‌شوند. تلاش‌ها و فعالیت‌های زیادی صورت گرفته تا کار تخصیص اصطلاحات نمایه‌ای به صورت ماشینی و بدون دخالت انسان انجام گیرد. بحث نمایه‌سازی خودکار برخاسته از این تلاش است. اصطلاحات نمایه‌ای یا توصیفگرهای هر مدرک به اضافه مشخصات کتابشناختی آن مدرک (نویسنده، عنوان، منبع، و چکیده)، مجموعاً یک رکورد کتابشناختی را تشکیل می‌دهند. اتخاذ روشی مناسب برای سازمان‌دادن این رکوردها در کنار یکدیگر باعث خواهد شد تا نظام بازیابی، عملکرد بهتری داشته باشد.

 

 

● واژگان مهار شده

به منظور ایجاد یکدستی و هماهنگی و نیز سهولت در بازیابی مدارک، معمولاً واژه‌ها یا اصطلاحاتی را که مبیّن موضوع مدرک هستند از سیاهه‌ای مستند به نام واژگان مهار شده انتخاب می‌کنند. فهرست‌های سرعنوان موضوعی، طرح‌های رده‌بندی، و اصطلاحنامه‌ها سه نوع واژگان مهار شده مهم هستند. زیرا در این منابع تلاش شده است تا اصطلاحات به صورت الفبایی و نیز به شکل نظام یافته ارائه شود (۱۴:۲).

نقطه مقابل استفاده از واژگان مهار شده، نمایه‌سازی با استفاده از زبان طبیعی است. منظور از زبان طبیعی واژه‌ها و کلماتی است که در متن به کار رفته و بنابراین اصطلاح "متن آزاد" را می‌توان مترادف آن در نظر گرفت. متن آزاد می‌تواند شامل عنوان، چکیده، برگزیده، یا متن کامل مدرک باشد. هنگام تحلیل اطلاعات می‌توان به جای انتخاب اصطلاحات نمایه‌ای از واژگان مهار شده، هر کدام از عناصر بالا را ذخیره کرد و در مرحله جست‌وجو مستقیماً مورد استفاده قرار داد. این روش که تاریخچه آن به کار مورتیمر تاب و نظام تکواژه‌ای او باز می‌گردد نخست به طور گسترده‌ای برای ذخیره و بازیابی متون رشته حقوق مورد استفاده قرار گرفت و با رواج و گسترش رایانه نضج گرفت. اما استفاده از زبان طبیعی دارای مزایا و معایب خاص خویش است.

 

 

● سازماندهی فایل‌ها

در نظام‌های رایانه‌ای ذخیره و بازیابی اطلاعات، داده‌ها معمولاً در قالب رکورد ذخیره می‌شوند و مجموعه‌ای از رکوردها یک فایل را تشکیل می‌دهند. شیوه ذخیره رکوردها در داخل فایل و شیوه ارتباط آنها با یکدیگر مطلبی است که تحت عنوان ساختار فایل یا سازماندهی فایل مورد بحث قرار می‌گیرد. برای سازماندهی فایل به طور معمول چندین روش وجود دارد که ساده‌ترین آنها فایل ترتیبی است. در این نوع فایل هیچ‌گونه راهنما یا اشاره‌گر ربط دهنده‌ای ایجاد نمی‌شود و معمولاً رکوردها بدون نظم خاصی در کنار یکدیگر قرار می‌گیرند. یافتن رکوردهای خاص در این گونه فایل‌ها منوط به آن است که یکایک رکوردها از ابتدای فایل بررسی شود. چنانچه با حجم زیادی از اطلاعات روبه‌رو باشیم استفاده از این نوع فایل بسیار وقت‌گیر است. در عوض، این ساختار حداقل فضای ذخیره‌سازی را به خود اختصاص می‌دهد و اجرای آن نیز نسبتاً آسان است. نوع دیگر، فایل شاخص‌دار یا فایل مقلوب است. در این نوع ساختار، که در نظام‌های معروف ذخیره و بازیابی اطلاعات به وفور مورد استفاده قرار گرفته، به ازای فیلدهای شاخص یا فیلدهایی که در نظر است بر روی آنها جست‌وجو صورت گیرد، فایل یا فایل‌های جداگانه‌ای به نام فایل شاخص یا فایل مقلوب ایجاد می‌شود. محتوای این فایل را مقادیر فیلد شاخص و نشانی متناظر به آن در فایل اصلی تشکیل می‌دهد. هنگام بازیابی، ابتدا عبارت مورد نظر در فایل مقلوب جست‌وجو می‌شود و سپس براساس شماره مدرک یا نشانی که در مقابل آن عبارت وجود دارد، رکورد کامل از فایل اصلی بازیابی می‌گردد. در این ساختار، به جهت آنکه حداقل دو فایل ایجاد می‌شود فضای بیشتری اشغال می‌گردد، ولی در مقابل، سرعت جست‌وجو و بازیابی به خصوص در پایگاه‌های حجیم تا حد زیادی بالا می‌رود. سومین نوع را فایل با دستیابی مستقیم می‌نامند دارد. در این ساختار، امکان نوشتن یا خواندن رکورد بدون در نظر گرفتن محل آن وجود دارد.

در این فایل‌ها لازم است که فیلدی به عنوان فیلد کلید مشخص گردد. در این نوع ساختار برای یافتن محل آزاد در حافظه جهت درج رکورد یا پیدا کردن رکوردی خاص، از فن آدرس‌دهیِ درهم استفاده می‌شود. مهم‌ترین ویژگی و مزیّت این ساختار، صرفه‌جویی در فضای حافظه و نیز سرعت زیاد در دستیابی به رکوردهاست. متقابلاً نقطه ضعف آن در سختی پیاده‌سازی و اجرای آن است. ساختار دیگر، ساختار زنجیره‌ای است و ویژگی آن در این است که همه اقلامی که نشان‌دهنده شناساگر فرضی مشترکی هستند با رابط‌ها یا اشاره‌گرهایی مناسب، به هم زنجیر می‌شوند. طبیعتاً یک راهنما دسترسی به اولین فقره را در هر زنجیره فراهم می‌آورد و فایل را می‌توان با تعقیب اشاره‌گرهای درونی هر زنجیره جست‌وجو کرد. فایل‌های زنجیره‌ای نسبت به فایل‌های ترتیبی سرعت بیشتری را فراهم می‌آورند، اما به فضای ذخیره‌سازی قابل توجهی برای ذخیره اشاره‌گرها و راهنماها نیاز دارند (۶۲۲:۵).

 

 

● جست‌وجوی اطلاعات

در این مرحله، وظیفه نظام ذخیره و بازیابی، بررسی و شناخت درخواست استفاده‌کننده، پویش یا جست‌وجو در بانک اطلاعاتی، و یافتن و نمایش رکوردهایی است که با درخواست ارائه شده انطباق دارد. دستیابی به این هدف، یعنی یافتن اطلاعاتی که نیاز استفاده‌کننده را به طور قطع برطرف کند عملاً کار آسانی نیست، زیرا از یک سو استفاده‌کننده به طور دقیق نیاز اطلاعاتی خود را نمی‌داند و در برخی اوقات نیز علی‌رغم آگاهی به نیاز اطلاعاتی خود، ممکن است نتواند آن را با عبارت‌های مناسب بیان کند. از سوی دیگر، ممکن است اصطلاحات یا عباراتی که به عنوان موضوع مدارک در نظر گرفته شده چندان دقیق نباشند و نتوانند تصویر کاملی از محتوای مدرک بدست دهند. بدین سبب گفته می‌شود که وجه خروجی نظام بازیابی اطلاعات (پاسخگویی به درخواست استفاده کننده) همواره پیچیده‌تر از وجه ورودی آن است و بدین لحاظ باید بخش خروجی مورد توجه بیشتری قرار گیرد (۱۴:۳).

شیوه‌های بازیابی اطلاعات را می‌توان در نگاه کلی به دو دسته:

ـ نظام‌های مبتنی بر انطباق مطلق و

ـ نظام‌های مبتنی بر انطباق نسبی، تقسیم کرد (۱۵۳:۳).

فنون انطباق مطلق در حال حاضر در بسیاری از نظام‌های سنتی بازیابی اطلاعات مورد استفاده قرار می‌گیرد. پرس‌وجوها در این روش معمولاً با استفاده از عملگرهای بولی تدوین می‌شوند و، برای بازیابی، تنها انطباق واژه‌های پرسش با عبارت‌های موجود در مدرک کفایت می‌کند.

در انطباق نسبی یا انطباق برتر[۴] این امکان وجود دارد که نظام بازیابی را بتوان با ورود رشته‌ای از اصطلاحات که بیانگر نیاز اطلاعاتی هستند، بدون استفاده از عملگرهای بولی، جست‌وجو کرد. در این نوع، نظام دنبال قطعاتی از متن می‌گردد که بهترین انطباق را با رشته ورودی داشته باشد. بنابراین، اگر رشته اصلی شامل پنج کلمه باشد و مدرکی در بانک اطلاعاتی نیز کلّ پنج واژه را دربرگیرد این مدرک حداکثر وزن ممکن را گرفته و در رأس سیاهه موارد بازیابی رشته قرار می‌گیرد (۱۵۳:۳). بر این اساس، الگوها و فنون مختلفی برای بازیابی شکل گرفته است که به عنوان مدل‌های کلاسیک و مدل‌های پیشرفته از آنها یاد می‌شود. مدل‌های کلاسیک بازیابی شامل مدل بولی، فضای برداری[۵] ، و مدل‌های احتمالی[۶] است. مدل‌های پیشرفته، علاوه بر مدل‌های فوق، شامل بازیابی براساس منطق مشکک (فازی)[۷] ، نمایه‌سازی معنایی نهفته[۸] ، شبکه‌های استنتاجی[۹] ، و نیز الگوهای مبتنی بر مرور شامل نظام‌های بازیابی فرامتن است (۱: ۲۴-۶۰).

 

 

● مدل بولی

اولین روش بازیابی که در نظام‌های اطلاعاتی اجرا شد مدل بولی بود که در آن اصطلاحات پرس‌وجو با عملگرهای بولی بیان شده و با نمایه مقلوب مقایسه می‌گردید. توانایی عملگرهای بولی برای ترکیب مفاهیم اجزا (AND) و مترادف (OR) و نیز زمان پاسخ سریع، این مدل را مدلی عام برای نظام‌های بازیابی ساخت.

با فراگیرتر شدن نظام‌های بازیابی بولی، تدوین پرس‌وجوهای مؤثر برای عموم افرادی که با منطق آشنا نبودند دشوار گردید. علاوه بر آن، نظام بولی اغلب تعداد مدارک را با توجه به ماهیت حساس منطق خود که پاسخی انعطاف‌ناپذیر در برابر بود یا نبود اصطلاحی واحد نشان می‌داد بازیابی می‌کرد.

برای غلبه بر مسئله بازیابی مدارک زیاد بدون توجه به میزان اهمیت کاربردی بالقوه آنها ـ اصلاحاتی در نظام صورت گرفت تا با اختصاص وزن‌هایی به اصطلاحات، براساس اهمیت "متصوّر" آنها، خروجی‌های ترتیبی تولید شود. روش‌های اصلاحی دیگر مانند کنترل فرایند تدوین پرسش برای کاهش مشکل ساخت پرس‌وجوهای بولی پیچیده نیز مورد تحقیق قرار گرفته است.

 

 

● مدل فضای بُرداری

در حالی که برخی تلاش کردند تا با انجام اصلاحاتی در مدل بولی بر نقاط ضعف آن غلبه کنند، دیگران با راهبرد متفاوتی به نام مدل فضای برداری به بازیابی اطلاعات پرداختند. در این مدل، مدارک و پرس‌وجوها به صورت بردارهایی در فضایی سه بعدی در نظر گرفته می‌شود که هر بعد با مدخلی در نمایه مقلوب متناظر است. مثلاً مدرک D و پرس و جوی Q در شکل برداری به صورت D= (d۱, d۲, d۳, .... dn)و Q= (q۱, q۲, q۳, .... qn) بیان می‌شود که n مجموع اصطلاحات نمایه‌ای و هر کدام از مقادیر داخل پرانتز وزن هر اصطلاح بوده که بیانگر اهمیت اصطلاح است.

شناخته شده‌ترین وزن اصطلاحی، بسامد مقلوب مدرک نامیده می‌شود که با بسامد مجموعه (تعداد مدارک مجموعه‌ای که در آن یک اصطلاح خاص وجود دارد) تغییر می‌کند. بسامد مقلوب مدرک نوعاً از طریقdkN Log محاسبه می‌شود که در آن N تعداد مدارک مجموعه و dk تعداد مدارکی است که اصطلاح k در آن ظاهر می‌شود. فرمول‌های مختلفی برای محاسبه اوزان اصطلاح وجود دارد که برخی از آنها گونه‌هایی از وزن IDFبوده و از بسامد مدرک (تعداد دفعاتی که اصطلاحی در مدرکی ظاهر می‌شود) و عادی‌سازی بهره می‌گیرند. مثلاً می‌توان IDF را در بسامد مدرک ضرب کرد (تا اصطلاحاتی که مکرراً در مدرکی ظاهر می‌شوند اهمیت بیشتری پیدا کنند) و بر عامل عادی‌سازی طول بردارها تقسیم کرد تا طول متغیر بردارهای مدرک مجموعه تنظیم شود. این عمل تابع فرمول زیر است:

Wki = idfk×tfk i Svector i (tfi×idf)۲

که در آن Wki وزن اصطلاح K موجود در مدرک d، tfki بسامد اصطلاح k در مدرک d، idfk بسامد مقلوب مدرک، و مخرج کسر عامل عادی‌سازی، و idfk بسامد مقلوب مدرک است.

مدل‌برداری، سیاهه‌ای ترتیبی از مدارک براساس مشابهت آنها با پرسش، با در نظر گرفتن زاویه میان بردار مدرک و بردار پرسش، به عنوان مقیاس مشابهت ارائه می‌دهد. علاوه بر فرمول‌های توزین اصطلاح، فرمول‌های دیگری نیز برای محاسبه مشابهت "پرسش ـ مدرک" پیشنهاد شده است. آزمایش‌ها نشان داده است که انتخاب مقیاس جدید مشابهت می‌تواند بر عملکرد بازیابی تأثیر قابل ملاحظه‌ای داشته باشد. یکی از مقیاس‌های مشابهت که به طور گسترده مورد استفاده قرار گرفته مشابهت کسینوسی است که حاصل ضرب درونی میان عناصر عادی سازی شده بردار در طول بردارهاست.

گونه دیگری از مدل‌برداری مدل خوشه‌ای است که در آن با محاسبه مشابهت برداری مدرک به مدرک و با استفاده از معیارهای خوشه‌بندی گروهی از مدارک شکل می‌گیرد. معیارهای خوشه‌بندی مشخص می‌کند چه چیز خوشه‌ای از مدارک را تشکیل می‌دهد. برخلاف مدل فضای برداری که در آن بردار هر پرسش با بردار هر مدرک مقایسه می‌شود، در اینجا، بردار هر پرسش با بردار مرکز خوشه، یعنی برداری که خوشه را به صورت کلی ارائه می‌کند، مقایسه می‌گردد.

مزیت رویکرد خوشه‌ای زمانی جلوه‌گر می‌شود که با مجموعه مدارکی به کار رود که بتواند خوشه‌های فشرده تشکیل دهد. همچنین، این مدل در محیطی مؤثر شناخته می‌شود که خوشه‌ها تمایل به ارائه مشترک مدارک مرتبط داشته باشند. با این حال، هیچ تضمینی وجود ندارد که مجموعه مدارک مفروض ضرورتاً به ساختار خوشه‌بندی مفیدی بینجامد، و حتی در موارد مفید، هزینه محاسبه ساخت، نگهداشت، و جست‌وجو در خوشه‌های کوچک و همبسته ممکن است به طور سرسام آوری بالا باشد.

مدل احتمالی. این مدل نخستین بار توسط استیو رابرتسن و کارن اسپارک جونز در سال‌های ۱۹۷۰ معرفی شد. این مدل به لحاظ اینکه مدارک و پرسش‌ها را به صورت بردار عرضه می‌کند شبیه مدل‌برداری است، اما به جای بازیابی مدارک براساس میزان مشابهت با پرسش، مدارک را براساس احتمال ارتباطشان با پرسش بازیابی می‌کند. احتمال ربط مدرکی خاص به پرسش را می‌توان با جمع اوزان ربط اصطلاحات آن مدرک، یعنی برآورد احتمال ظهور اصطلاحات موجود در پرسش و در مدرک مرتبط، و نه در مدرک غیرمرتبط، محاسبه کرد.

در مدل بازیابی کلاسیک احتمالی، این احتمالات اصطلاح از طریق مجموعه‌ای نمونه از مدارک و پرسش‌ها همراه با قضاوت مرتبط مربوط به آن تخمین زده می‌شود. با وجود این، اجرای فرایند تخمین به صورت عملیاتی مشکل است، زیرا جمع‌آوری داده‌های ربط لازم قبل از جست‌وجوی واقعی عملاً غیرممکن است. در نتیجه، برای تخمین احتمال اصطلاح، معمولاً، در این مدل از بازخورد ربط استفاده می‌کنند (۳:۷-۵).

 

 

● فرامتن

شکل دیگری که برای جست‌وجو و بازیابی اطلاعات ارائه شده، و به خصوص در سال‌های اخیر با رشد شبکه وب گسترش یافته است، بازیابی فرامتنی است. روش‌هایی که تاکنون ذکر شد عمدتاً بر این محور استوار است که کاربر پرسش خود را در قالب واژه‌ها و عباراتی به نظام ارائه کند تا نظام، پس از جست‌وجو، تعدادی مدرک را به عنوان نتیجه جست‌وجو بازگرداند. در مقابل این نظام‌ها که می‌توان آنها را نظام‌های پرسش مدار نامید، نظام‌های فرامتن تلاش می‌کنند با ایجاد پیوندهای مفهومی میان مدارک و فراهم‌آوردن امکان مرور و راهبری، کاربر را در رسیدن به مدرک مورد نظر یاری دهند. از این دو نوع رویکرد، به ترتیب، به حرکت از کجا به چه (کاربر می‌داند در کجای بانک اطلاعاتی است و می‌خواهد بداند در آنجا چه چیز وجود دارد) و حرکت از چه به کجا (کاربر می‌داند چه چیزی می‌خواهد و می‌خواهد بداند آن چیز را در کجا می‌تواند بیابد) تعبیر شده است (۳۰۰:۴). در نظام‌های فرامتن، هر کدام از مدارک یا الام اطلاعاتی، یک گره و رابطه میان گره‌ها، پیوند نامیده می‌شود. در هر گره یک یا چند واژه یا عبارت برجسته وجود دارد که آن را لنگر[۱۰] می‌نامند و زمانی که از سوی کاربر انتخاب یا فعال می‌شوند، با استفاده از پیوندها، کاربر را به گره مرتبط دیگری هدایت می‌کنند. گره‌ها علاوه بر متن می‌توانند شامل قطعات صوتی و تصویری مانند موسیقی، فیلم، عکس، و جز آن نیز باشند.

 

 

● ارزیابی نظام بازیابی

در بحث از ارزیابی نظام باید به سه پرسش پاسخ گفت:

۱) دلیل ارزیابی نظام چیست؟

۲) چه عنصری از نظام ارزیابی می‌شود؟

۳) ارزیابی نظام چگونه یا به چه شیوه‌ای صورت می‌گیرد؟

ارزیابی نظام به منظور سنجش منافع یا زیان‌هایی که از نظام بازیابی حاصل می‌شود و نیز برای سنجش هزینه و سودمندی نظام صورت می‌گیرد. در ارزیابی معمولاً عناصر زیر که گویای توانایی نظام در رفع نیاز استفاده‌کننده است مورد توجه قرار می‌گیرد:

۱) پوشش مجموعه، یا تعداد مدرک مرتبطی که در هر مجموعه وجود دارد؛

۲) زمان پاسخگویی، یعنی فاصله متوسط میان زمان درخواست جست‌وجو و به‌دست‌آوردن پاسخ؛

۳) شکل خروجی، یعنی شکل مدارک بازیابی شده، شماره مدرک، مآخذ کتابشناختی، مآخذ همراه با چکیده‌ها، متن کامل، و جز آن؛

۴) تلاش استفاده کننده، یعنی کوششی که استفاده‌کننده در مرحله خروجی (جدا کردن مدارک مرتبط از نامرتبط)، در مرحله درخواست (بیان هر چه دقیق‌تر پرسش یا نیاز اطلاعاتی)، و در مرحله تدوین راهبرد جست‌وجو (بررسی راهبرد تدوین شده و اصلاح آن) انجام می‌دهد؛

۵) جامعیت، یعنی توانایی نظام در بازیابی متون مرتبط؛ و

۶) مانعیت، یعنی توانایی نظام در بازیابی نکردن متون نامرتبط.

گفته می‌شود که موارد ۱ تا ۴ به راحتی قابل ارزیابی است لیکن این جامعیت و مانعیت است که در کنار یکدیگر سودمندی نظام را نشان می‌دهند. در واقع این دو معیار در کنار هم توانایی فیلتری نظام را بیان می‌کنند و استفاده از هر کدام از آنها به تنهایی چندان کارساز نیست (۵۵:۳-۶۱؛ ۲۰۴:۶). در هر نظام بازیابی، مطلوب آن است که نسبت جامعیت و مانعیت هر دو ۱۰۰ درصد باشند، یعنی نظام بتواند کلیه مدارک مرتبط موجود را بازیابی کند و در عین حال هیچ یک از مدارک غیرمرتبط را را نیز ارائه ندهد. اما رسیدن به چنین آرمانی عملاً غیرممکن است، و در واقع این مسئله یکی از مهم‌ترین تفاوت‌های میان نظام‌های ذخیره و بازیابی اطلاعات و نظام‌های مدیریت پایگاه داده‌ها را تشکیل می‌دهد. جامعیت و مانعیت با یکدیگر رابطه‌ای معکوس دارند، یعنی هر گونه تلاشی برای افزایش مانعیت منجر به کاهش جامعیت و هرگونه کوششی برای افزودن جامعیت باعث کاهش مانعیت می‌شود. بنابراین، در عمل باید به نسبتی معقول میان این دو رسید. نیاز استفاده‌کننده یکی از عوامل مؤثر در تعیین این نسبت است.


|
امتیاز مطلب : 5
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1
موضوعات مرتبط: ▼ مقالات عمومی پایگاه داده , ,
تاریخ : چهار شنبه 25 مرداد 1391
نویسنده : hamidrezakhouri

تعریف ارائه شده برای ERP

شاید ارائه تعاریفی برای ERP بتواند به شناخت بهتر این مجموعه كمك نماید.

ERP را می توان به عنوان نرم افزار یکپارچه ای تعریف نمود که دارای اجزا و یا ماژولهایی برای برنامه ریزی، تولید، فروش، بازاریابی، توزیع، حسابداری، مدیریت منابع انسانی، مدیریت پروژه، مدیریت موجودی، مدیریت خدمات و نگهداری و تعمیرات، مدیریت حمل و نقل و بازرگانی الکترونیک است. معماری و ساختار ERP بگونه ای است که یکپارچگی و جامعیت اطلاعات سطح سازمان را فراهم نموده و جریانی روان از اطلاعات بین بخشهای مختلف سازمان فراهم می آورد."

روشی برای برنامه ریزی و کنترل موثر تمامی منابع مورد نیاز برای دریافت، تولید، ارسال و پاسخگویی به نیازهای مشتریان، در شرکتهای تولیدی، توزیعی و خدماتی."

"ERPیک بسته نرم افزاری تجاری است که هدف آن یکپارچگی اطلاعات و جریان اطلاعات بین تمامی بخشهای سازمان از جمله مالی، حسابداری، منابع انسانی، زنجیره عرضه و مدیریت مشتریان است."

"سیستمهای ERP سیستمهای اطلاعاتی قابل تغییر و تنظیمی هستند که اطلاعات و فرایندهای مبتنی بر اطلاعات در سازمان را در درون واحدهای سازمانی و بین آنها یکپارچه می نماید."

"ERP یک پایگاه داده، یک برنامه کاربردی و یک واسط یکپارچه در تمامی سازمان است."

"ERPسیستمهایی مبتنی بر کامپیوتر هستند که برای پردازش تراکنشهای سازمان طراحی شده اند و هدف آنها تسهیل برنامه ریزی، تولید و پاسخگویی به موقع به مشتریان در محیطی یکپارچه است."

"ERP یک بسته نرم افزاری استاندارد مشتمل بر چندین ماژول مرتبط و یکپارچه است که کلیه فرآیندهای تجاری یک سازمان را اعم از تولید ، منابع انسانی ، مالی ، بازاریابی و فروش و ... پشتیبانی می نماید و منجر به یکپارچگی وظایف ( Functions ) در سازمان می شود."

"یک راه حل سیستمی مبتنی بر فناوری اطلاعات است که منابع سازمان را توسط یک سیستم به هم پیوسته، به سرعت و با دقت و کیفیت بالا در کنترل مدیران سطوح مختلف سازمان قرار می دهد تا به طور مناسب فرایند برنامه ریزی و عملیات سازمان را مدیریت نماید."

ERPبه مثابه ستون فقرات اطلاعاتی یک سازمان از لحاظ بانک های اطلاعاتی و فرآیندهای سازمانی محسوب شده و به منزله نرم افزاری برای پشتیبانی فرآیندهای داخلی سازمان است.

از لحاظ شماتیك می توان ساختار زیر را برای ERP طراحی نمود. البته این ساختار در سال ۹۸ توسط آقای Davenport ارائه شده است.

آنچه در تعریف اول ارائه شده و سایر تعاریف مهم است، توجه و تمرکز بیشتر بر روی عبارت Enterprise در اختصار ERP است تا توجه به عبارات دیگر اختصار از جمله Planning و Resource. چراکه این سیستم فراتر از برنامه ریزی عمل کرده و با وجود تمرکز بر روی منابع سازمان، عناصری فراتر ازآن را پوشش می دهد.

آنچه که در این تعاریف بیش از همه نمود دارد، یکپارچگی و استاندارد بودن سیستم ERP است و همین دو جنبه مهم از ERP آنرا از سایر سیستمهای اطلاعاتی یکپارچه متمایز می سازد. در آینده بصورت مفصل در مورد تفاوت ERP با سیستمهای اطلاعاتی یكپارچه موجود در بازار و بخصوص بازار نرم افزاری ایران بحث خواهد شد


|
امتیاز مطلب : 3
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1
موضوعات مرتبط: ▼ مقالات عمومی پایگاه داده , ,
تاریخ : چهار شنبه 25 مرداد 1391
نویسنده : hamidrezakhouri

با نگاهی به دهه گذشته می‌توانیم از یک سو،  مجموعه گسترده‌ای از نوآوری‌‌ها را مشاهده کنیم   

که در دنیای IT سروصدای زیادی به پا کرده‌اند و امید زیادی به آینده آن‌ها وجود دارد و از سوی دیگر، شک و تردیدهای فراوانی را مشاهده کنیم که درباره استفاده از این فناوری‌ها به چشم می‌خورد، به ویژه زمانی که استفاده از این فناوری‌ها به معنای تغییر روش انجام کارها باشد.

کافی است تا پیشرفت سریع نرم‌افزار به‌عنوان خدمات یا Software as a Service را در نظر بگیرید. در ابتدای دهه قبل، هیچ‌کس نام Salesforce.com را نشنیده ‌بود و تعداد کمی از سازمان‌های فنی و کسب‌وکارها به این مسئله فکر می‌کردند که می‌توان نرم‌افزار را در قالب مدل ارائه مجوز هنگام ثبت‌نرم‌افزار یا مبتنی بر اشتراک خریداری کرد. اما در حال حاضر، Salesforce.com برای همگان نامی آشنا است و ارائه‌دهندگان خدمات آی‌تی مدل SaaS را به عنوان یک روش بالقوه و مناسب برای فروش نرم‌افزار پذیرفته‌اند. حتی مایکروسافت نیز تصمیم دارد آفیس را در محیط ابری ارائه دهد.

در مرحله بعدی، مجازی‌سازی قرار دارد که از بعد تکنیکی کمی قدیمی‌تر است و می‌توان به آن همانند مین‌فریم‌های نسل دوم شرکت آی‌بی‌ام نگاه کرد. این فناوری بعد از چهار دهه توانسته‌ معماری x86 و نحوه پیاده‌سازی سیستم‌عامل‌ها و برنامه‌ها را متحول کند.

آنچه که فناوری‌های فوق به آن نیاز داشتند ارائه یک ایده راهگشا بود که بتواند پاسخ‌گوی نیازهای فراوان کسب‌وکار باشد، با استفاده از SaaS می‌توان نود درصد از قابلیت‌های برنامه‌های در مقیاس سازمانی را با کمترین یا حتی بدون هرگونه هزینه اضافی در محیط ابری پیاده‌سازی کرد. با استفاده از مجازی‌سازی سرورها، دنیای آی‌تی توانست مشکلات مراکز داده، نظیر نگهداری و هزینه انرژی را کاهش داده و سناریوهای مقابله با خطاهای پیش‌بینی نشده را کم‌هزینه‌تر و آسان‌تر کند و فرآیند افزودن منابع محاسباتی را تقریباً به یک کار آنی و بدون درنگ تبدیل کند. منافع و ارزش هر یک از این فناوری‌ها، به حدی آشکار بود که پذیرفته‌شدن و عمومیت یافتن آن‌ها فقط به کمی زمان نیاز داشت.

درحال‌حاضر، ما منتظر نوآوری دیگری هستیم که به زودی در مراکز داده استفاده خواهد شد. شاید پیش از این عباراتی نظیر Unified Computing، Utility Computing، Agile Computing و Cloud Computing را شنیده باشید. شاید این طور به نظر برسد که این کلمات برای بازارگرمی به کار برده می‌شوند، اما این ایده‌ها در حال منسوخ‌کردن مراکزداده سنتی و یکپارچه‌سازی سرورها هستند. پلتفرم‌های محاسباتی یکپارچه کنونی، متعهد هستند تا همه چیز را یکپارچه‌کرده و تا حد ممکن سرویس‌ها را از طریق سرورهای کمتری پیاده‌سازی کنند و هر روز شاهد آن هستیم که شرکت‌های معتبر با مراکز تحقیقاتی بزرگ‌تر و بودجه تحقیقاتی بیشتر، موفق می‌شوند تا یکی دیگر از ریسک‌های پیش رو را از میان برداشته و ما را به این هدف نزدیک‌تر کنند.

مراکز داده در یک جعبه

برای پیاده‌سازی یک برنامه کاربردی چه کارهایی باید انجام داد؟ مدیر پروژه وظیفه دارد تا در ابتدای پروژه با مدیر سرور، مهندسان شبکه و متخصصان رسانه‌های ذخیره‌سازی یک جلسه آغازین تشکیل دهد. این جلسه برای برنامه، خبر بدی برای برنامه شما به شمار می‌آید، زیرا این گروه از متخصصان، افراد هوشمندی هستند و در زمینه‌های مختلفی تجربه دارند و این یعنی آن‌که این افراد سؤالات زیادی خواهند پرسید و ایرادهای زیای را از برنامه شما، تأثیر آن بر شبکه و منابعی که لازم است تا این پروژه عملیاتی شود، مطرح خواهند کرد و بدون آن‌که خودتان متوجه شوید، وارد فرآیندی خواهید شد که هدف از آن اطمینان از درستی و صحت اجرای پروژه است.

مشتری یکی از شرکت‌های ارائه‌دهنده محیط محاسبات یکپارچه ادعا کرد که او نزدیک به هجده‌ماه‌زمان صرف کرد تا نیاز سازمان به سرورها را برای پیاده‌سازی پروژه‌ای خاص در سطح سازمان تدارک ببیند. اگرچه این نمونه بارزی از عدم تمایل سازمان‌ها به مواجه با تحولات و نیازهای جدید است، اما وقتی فریم‌ورکی ایجاد شده است تا با مشکلات کنونی آی‌تی دست‌وپنجه نرم کند، یعنی فریم‌ورک باید هوشمندی و سرعت کافی را برای حل مشکلات سازمان‌های بزرگ نیز داشته‌باشد.

زمانی که شما در مرحله برنامه‌ریزی هستید می‌توانید چینش تجهیزات و کابل‌ها را به هر شکل که مناسب است، فراهم کنید. شما به اتصال‌هایی به رسانه ذخیره‌سازی نیازمند هستید تا محیط ذخیره‌سازی جانبی و منبع برق جانبی را برای شما فراهم‌کند. ممکن است به چیزی بیش از شبکه با پهنای باند گیگابیت نیاز داشته باشید و برای مقابله با مشکل قطع احتمالی آدرس‌های IP به چندین سوییچ و مسیر ارتباطی نیاز داشته باشید.

اگر در حال پیاده‌سازی محیط با استفاده از سرورهای 1U هستید (سرورهای منفرد و مستقل از هم)، در این صورت به احتمال زیاد حجم زیادی از سیم و کابل از پشت سرور شما خارج خواهد شد. در صورت استفاده از KVM و چندین نمونه از این سرورها با حجم بسیار زیادی از کابل‌ها مواجه خواهید شد که منظم‌کردن آن‌ها به داشتن مدرک دکترا در زمینه کابل‌کشی ساخت‌یافته نیاز دارد.

در طول چندسال گذشته، شرکت‌های پیشرو و نوآور مانند سیسکو، اچ‌پی، آی‌بی‌ام و Egenera مبالغ زیادی را در واحدهای تحقیق و توسعه خود سرمایه‌گذاری کرده‌اند. این شرکت‌ها به دنبال آن هستند تا نه‌تنها سرورهای خود را یکپارچه‌سازی کنند، بلکه بتوانند تجهیزات مرتبطی نظیر شبکه و رسانه‌های ذخیره‌سازی  را نیز به صورت یکپارچه‌شده ارائه دهند. نتیجه تلاش این شرکت‌ها، باعث خواهد شد تا مراکزداده شما در طول پنج تا ده سال آینده ظاهری کاملاً متفاوت به خود بگیرند.

کیس مربوط به سرورهای تیغه‌ای را در نظر بگیرید که تنها دو کابل ارتباطی به سوییچ توزیع یا سوییچ مرکزی شما خواهد داشت. شرایطی را تصور کنید که پهنای باند مورد نیاز شما به صورت مشترک از طریق این دو مسیر فراهم می‌شود و کاری می‌کنید که این ساختار برای سیستم‌عامل همانند یک رابط فیبر نوری یا رابط iSCSI یا رابط GigE یا رابط 10GigEعمل کند.

دنیایی را تصور کنید که در آن مدیر رسانه ذخیره‌سازی LUNهای رسانه را طوری تنظیم می‌کند که شما بتوانید بعدها و با استفاده از شماره منحصربه‌فرد جهانی LUN (معروف به WWPN) به آن دسترسی داشته‌باشید و درنهایت زمانی را تصور کنید که برای ایجاد زیرساخت لایه اول به منظور اضافه کردن، تغییر شبکه یا سرویس‌های ذخیره‌سازی به حضور درمحل نیازی نباشد. امروزه، پلتفرم‌های محاسباتی یکپارچه مبتنی بر رویکرد «یک‌بار کابل‌کشی کن» یا همان مراکزداده در یک جعبه واقعی رؤیایی دور از دسترس نیستند. این ایده‌ با سرعت زیادی در حال پیاده‌سازی و تکامل است.

اگر چنین ایده‌ای برای شما خوشایند به نظر آید، به این معنی نیست که آن ایده حتماً برای مدیر ارشد مالی سازمان شما نیز خوشایند است. اجازه بدهید با مسئله انرژی مصرفی و نیاز به آماده‌سازی مرکز داده شروع کنیم. شرکت Tudor Perini، یک شرکت تأسیساتی و ساختمانی یک میلیارددلاری است که به‌تازگی به بزرگ‌ترین مشتری UCS برای تجهیزات سیسکو تبدیل شده‌است.

 جیمز مک گیبنی مدیر مرکزداده شرکت Tudor Perini می‌گوید: «این شرکت مجموعه سرورهای خود را از چهارصد سرور فیزیکی به 36 سرور تیغه‌ای سیسکو تبدیل کرد که روی چهار اتاقک یا رک از نوع UCS کار می‌کنند.» در همین زمان گروه جیمز مک گیبنی موفق شد در عرض 58 روز، پنج مرکز داده فیزیکی در سراسر امریکا را به یک مرکزداده تبدیل کند، این کار موفقیت بزرگی بود که البته کمک‌های شرکت سیسکو نیز در آن نقش مهمی داشت.

جیمز مک گیبنی نمی‌توانست میزان واقعی هزینه ناشی از صرفه‌جویی در تجهیزات، انرژی مصرفی، هزینه‌های مدیریتی و نگهداری را دقیق مشخص کند، اما او فکر می‌کند که به این ترتیب در بودجه IT به میزان شصت‌درصد صرفه‌جویی‌خواهدشد. زمان بازگشت سرمایه‌گذاری نیز به دلیل نداشتن رقم دقیق صرفه‌جویی نامشخص بود، اما در خوش‌بینانه‌ترین حالت سرمایه‌گذاری انجام‌شده در کمتر از یک سال جبران می‌شود. با در نظر گرفتن دوره زمانی چهار ساله برای بازگشت سرمایه‌گذاری به نظر می‌رسد که این پروژه و زمان کوتاه بازگشت سرمایه آن می‌تواند مدیران ارشد مالی هر شرکتی را به خود جلب کند.

راهبرد مورد نیاز برای موفقیت

اگر بهره‌وری فضا،  انرژی و سرعت بالا در فرآیندهای کسب‌وکار برای شما مهم است، سؤال اصلی این نیست که چه زمانی سراغ راهکار محاسبات یکپارچه خواهیدرفت، بلکه سؤال اصلی این است که کدام فروشنده، راهکار مدیریتی و راهبرد مهاجرت شما را با کمترین مخاطرات به چنین مقصودی می‌رساند. با وجود نام‌های بزرگ در دنیای محاسبات یکپارچه می‌توان گفت که اگر شما روی فناوری‌های سیسکو، اچ‌پی، آی‌بی‌ام یا دل سرمایه‌گذاری کنید، در این صورت به مدت ده سال به عنوان مشتری خدمات این سازمان‌ها، باقی خواهید ماند. بنابراین پاسخ به این معادله چند مجهولی و انتخاب فناوری و شرکت مناسب به این بستگی دارد که نیازهای کلی زیرساخت مدیریتی شما چیست. احتمالاً برای درک بهتر نیازهای خود باید بتوانید از نمودارها و دیاگرام‌ها کمک بگیرید.

باید ابتدا در این باره تصمیم بگیرید که آیا شما به ارائه‌دهنده‌ای نیاز دارید که بتواند یک راهکار سخت‌افزاری و نرم‌افزارهای پیشرفته مورد نیاز را برای خودکار کردن قوانین پیچیده کسب‌وکار و برنامه‌های مرتبط به طور کامل و یکپارچه به شما ارائه دهد؟ در این صورت اچ‌پی و آی‌بی‌ام بهترین گزینه‌های موجود هستند. اگرچه بسیاری از شرکت‌ها از میزان تحمل خطا و توانایی‌های VMware ESX و ترکیب آن با سیستم‌های مدیریت شبکه خود راضی هستند، اما همه آن‌ها به گروهی از مهندسان آی‌بی‌ام یا اچ‌پی نیاز ندارند و می‌توانند بدون آن‌ها نیز براساس رویدادهایی که در طول زمان رخ‌می‌دهد زیرساخت مناسب را برای خود ایجاد کنند. در این صورت سخت‌افزار و نوآوری‌های مبتنی بر نیازهای آینده در طراحی UCSهای سیسکو می‌تواند همه آن چیزی باشد که شما به آن نیاز دارید.

بازیگران اصلی
با این اوصاف، به احتمال زیاد شما تاکنون به فکر ایجاد یک زیرساخت محاسباتی یکپارچه به‌عنوان بخشی از برنامه‌هایی هستید که درنهایت قرار است محیط محاسباتی با قدرت پتافلاپ ایجاد کند. محیطی محاسباتی که  نظیر آن را می‌توان در ابرکامپیوتر Roadrunner شرکت آی‌بی‌ام مشاهده کرد. نگران نباشید، زیرا امروزه دیگر پلتفرم‌های محاسباتی یکپارچه به فضای زیادی نیاز ندارند. درحقیقت، در بسیاری از موارد فضای یک رک همه آن چیزی است که به آن نیاز دارید، زیرا یکی از منافع محاسبات یکپارچه‌، کوچک شدن مراکزداده است نه گسترده شدن آن‌ها.

اگر شما کیس یک سرور تیغه‌ای را در کنار کیس مربوط به سخت‌افزار محاسبات یکپارچه قرار دهید، تفاوت زیادی بین آن دو مشاهده نخواهید کرد. اما اگر آن‌ها را دقیق‌تر بررسی کنید پی‌خواهید برد که درحال‌حاضر، رقابت بر سر I/O مجازی و پشتیبانی از میزان نامحدود حافظه است.

سیسکو که کمی دیرتر از دیگران وارد رقابت درزمینه Utility Computing شده‌، نوآوری‌های زیادی را در این زمینه ارائه‌کرده‌است. نوآوری‌های زیادی در کیس‌های سرورهای تیغه‌ای نوع UCS وجود دارد که آن‌ها را از بعد مهندسی بسیار جذاب می‌کند. سیسکو نخستین شرکتی است که مفهوم Stateless Server Computing را پیاده‌سازی کرد. این عبارت به طور خلاصه به آن معناست که سرورهای تیغه‌ای نوع UCS شرکت سیسکو برخلاف سرورهای تیغه‌ای مرسوم، از هیچ‌گونه بایوس یا فرم‌ویر استفاده نمی‌کنند. درنتیجه، بدون استفاده از کیس‌های UCS استفاده از این سرورها، عملاً غیرممکن است.

نکته جالب درباره این سرورها  این است که بایوس و فرم‌ویر به‌طور کامل از سخت‌افزار فیزیکی مجزا شده و به عنوان ویژگی‌های سرور می‌توان آن‌ها را مدیریت کرد. در حقیقت، همه مؤلفه‌های سخت‌افزاری یک سرور معمولی به حالت انتزاعی تبدیل شده و به صورت مستقل از هم و در قالب یک فایل XML به مدیر UCS معرفی می‌شوند. اینجا است که تفاوت‌های جذاب این نوع سرورها روشن می‌شود. فرض کنیم که شما یک وب سرور استاندارد دارید که تأییدیه اجرای آن روی یک پلتفرم سخت‌افزاری را در اختیار دارید. این ویژگی‌های سخت‌افزاری می‌توانند در قالب یک الگو دسته‌بندی شده و در یک لحظه به تعداد دفعات دلخواه شما پیاده‌سازی شوند. حال فرض کنیم که وب‌سرور شما به دو رابط شبکه GigE و یک کانال فیبر نوری HBA نیاز دارد تا از طریق آن به SAN متصل شود.

با استفاده از UCSهای شرکت سیسکو همه آن منابع سخت‌افزاری را می‌توانید به‌عنوان یک پروفایل خدماتی تعریف کرده و این الگو را هر زمان که نیاز باشد، پیاده‌سازی کنید. فرض کنیم مهندس واحد رسانه‌های ذخیره‌سازی می‌تواند از قبل مجموعه‌ای از LUNها را تعریف کند. در این صورت شما نیز می‌توانید پروفایل تجهیزات خدماتی خود را براساس WWPNهای متناظر با آن LUNها تعریف کنید و آن‌ها می‌توانند به‌طور خودکار به سرورهای مجازی که به‌تازگی پیاده‌سازی می‌شوند، متصل شوند یا آن‌که در صورت لزوم به یکی از سرورهای تیغه‌ای نوع UCS متصل شوند.
سیسکو به تازگی نسل دوم سرورهای تیغه‌ای خود را با نام رمز Ventura ارائه‌کرده‌است. این سرورها که نتیجه همکاری مشترک با اینتل است، از یک ASIC سفارشی استفاده می‌کند که به آن امکان می‌دهد تا 384 گیگابیت رم را از سوکت یک سرور تیغه‌ای با دو پردازنده آدرس‌دهی کند. این یک تحول مهم است، زیرا یکی از مشکلات مربوط به سرورهای تیغه‌ای با دو سوکت برای پردازنده‌های Intel Xeon 5500 این است که این سرورها حداکثر می‌توانند 144گیگابایت رم را آدرس‌دهی کنند. با استفاده از فناوری حافظه توسعه‌یافته یا Exentended Memory که توسط سیسکو ارائه می‌شود، هر ASIC می‌تواند چهار اسلات حافظه DIMM را با حداکثر سرعت آن‌ها به یک رابط حافظه نگاشت دهد. درنتیجه، هر سرور تیغه‌ای از نوع Ventura حاوی 48 رابط DIMM است در حالی‌که سرورهای تیغه‌ای استاندارد دو سوکتی می‌توانند تا دوازده رابط DIMM داشته‌باشند. با ارائه 48 رابط DIMM روی هر سرور تیغه‌ای Ventura می‌توانید برای نیاز حافظه سرورهای مجازی از رم‌های ارزان‌تر استفاده کرده یا آن‌که با نصب حافظه‌های هشت‌گیگابایت روی هر اسلات، تعداد سرورهای مجازی در هر سرور تیغه‌ای را به حداکثر برسانید. ارائه این میزان حافظه روی سرورهای تیغه‌ای، یک قابلیت منحصر به فرد است که در حال حاضر تنها در سرورهای تیغه‌ای شرکت سیسکو ارائه می‌شود.

I/O مجازی نیز یکی از ویژگی‌های مهم در UCSهای سیسکو است. این مورد نیز به‌طورمستقیم با کیس و نرم‌افزار مدیریتی مجموعه در ارتباط است. درنتیجه، هیچ یک از اسلات‌های سرورهای تیغه‌ای با I/O مجازی درگیر نیست. متأسفانه برای آن‌که بتوان در کیس‌های UCS سیسکو I/O مجازی داشت، باید I/O مجازی را از طریق سوییچ‌های ارتباطی فیبر نوری مدل Nexus که توسط سیسکو ارائه می‌شود، جابه‌جا کنید. زیرا پروتکل کنترلی لایه سه که بار I/O مجازی را مدیریت می‌کند ساختار انحصاری دارد. در مقابل آی‌بی‌ام و اچ‌پی از سناریوهای I/O مجازی مختلف پشتیبانی می‌کنند که در آن‌ها می‌توان از تجهیزات ارائه‌دهندگان مختلف استفاده کرد.

اما سیسکو که یک رقیب تازه وارد در این بازار به شمار می‌رود به همراه اچ‌پی سال‌ها است که به عنوان رهبران بازار سرورهای x86 مطرح هستند. سیسکو به وضوح اعلام می‌کند که شرکت اچ‌پی با عرضه جداگانه نرم‌افزار ضروری مدیریت از فرآیند خرید سرور یک حرکت رقابتی انجام می‌دهد. اما حاشیه سود و رقابت در بازار سرورها بسیار ناچیز است، در نتیجه منطقی است که اچ‌پی نیز تمرکز بیشتری را روی نرم‌افزارهای جانبی مرتبط با سرورها داشته‌باشد. در طرف مقابل شرکت سیسکو به‌عنوان یک تازه‌وارد توانایی ارائه قیمت بالاتر را برای یک بسته کامل و بی‌نظیر با قابلیت‌های اختصاصی دارد و همچنین به واسطه ارائه نرم‌افزار مدیریت سرورها، با شرکت اچ‌پی رقابت کند.

آنچه که به ارزش UCSهای شرکت سیسکو می‌افزاید، توانایی تعیین نوع سخت‌افزار مورد نیاز و همچنین توانایی آن در کنترل یکپارچه چندین UCS بدون هر گونه هزینه اضافی است. یکی دیگر از قابلیت‌هایی که به عنوان ارزش افزوده این سیستم‌ها مطرح است، این است که با استفاده از مدیر UCSهای سیسکو، تعامل شما با سوییچ و روترهای سیسکو به حداقل می‌رسد. اما UCS در رقابت با تجهیزات اچ‌پی، BMC و CA ضعف‌هایی نیز دارد.  UCS نمی‌تواند بارکاری واقعی هر یک از سرورهای مجازی در حال فعالیت در محیط شما را مدیریت کند. همچنین سیسکو ابزارهای مدیریت تغییرات، ابزارهای تنظیم سیستم یا ابزاری جهت کنترل وضعیت و صحت برنامه‌ها ارائه نمی‌دهد.
سایر شرکت‌ها
در این میان، نباید شرکت مطرح آی‌بی‌ام را فراموش کرد. شرکتی که قدیمی‌ترین، مهم‌ترین و پیشروترین شرکت در زمینه ارائه سرورهای سازمانی به شمارمی‌رود. در اصل راهبرد آی‌بی‌ام در بازار UCSها بسیار شبیه به سیسکو است و این شرکت نیز با ارائه IBM BladeCenter و I/O مجازی و یکپارچه‌شده که از طریق محصول Open Fabric Manager مدیریت می‌شود، روشی مشابه با روش سیسکو را در پیش گرفته است.

ابزار مدیریتی پیشرفته ارائه‌شده به همراه BladeCenter نیز همانند UCS، مجموعه‌ای از توانایی‌های سخت‌افزاری تأثیرگذار فراهم می‌کند. همچنین توانایی آدرس‌دهی سرورها، ارائه WWPN برای ارتباط با SAN و موارد مشابه و نیز توانایی ارتباط خودکار این آدرس‌ها به سرورهای تیغه‌ای مورد نظر از جمله این موارد هستند. از دیگر موارد جالب و تأثیرگذار، می‌توان به توانایی BladeServer برای مقابله با خطاهای منجر به از مدار خارج شدن سرورها اشاره کرد که در این موارد نیز یک سرور جانبی در همان کیس یا کیس دیگر وجود دارد که به‌سرعت جانشین سرور غیرفعال شده می‌شود. سرور جانبی به طور خودکار همه ویژگی‌های سرور اصلی را به ارث می‌برد که می‌توان به آدرس پورت و نگاشت‌های I/O اشاره کرد. آخرین موردی که باید به آن اشاره کرد، محصولات مشترک دو شرکت دل و Egenra است که از طریق تجهیزاتی نظیر PAN Orchestration (در اینجا PAN سرنام Processing Area Network است)، محصول Egenra روی سرورهای دل، قصد رقابت با بقیه بازار را دارند.

در حالی که دل به واسطه تعداد مشتریان از شرکت سیسکو جلوتر است، اما از آنجا که واحد محاسبات یکپارچه این شرکت هم‌اکنون در حال توسعه است، در رقابت با دیگران با دشواری‌هایی مواجه خواهد شد. اول آن‌که شرکت دل در اصل قصد دارد تا فناوری شرکت Egenra را به صورت OEM عرضه کند و در این فرآیند پشتیبانی سطح اول توسط دل و پشتیبانی سطح دوم و سوم توسط Egenra ارائه خواهد شد. در حالی که با استفاده از محصولات آی‌بی‌ام، اچ‌پی و سیسکو همه نیازهای خدماتی و پشتیبانی مورد نیاز شما توسط یک شرکت ارائه می‌شود و هیچ نوع رابطه‌ای از نوع OEM به چشم نمی‌خورد که لازم باشد نگران پیچیدگی‌های آن باشید.

بنابراین، با وجود آن‌که دل یکی از مطرح‌ترین بازیگران بازار سرورهای x86 است و در حالی که شرکت Enegra، یکی از بازیگران اصلی در عرضه محصولات مجازی‌سازی I/O و سازماندهی سازمانی است، درنتیجه، روشی که دل در پیش خواهد گرفت تا در این بازار رقابتی جدید نیز باقی بماند، یکی از موضوعات بحث‌انگیز و جالب خواهد بود.

|
امتیاز مطلب : 5
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1
موضوعات مرتبط: ▼ مقالات عمومی پایگاه داده , ,

صفحه قبل 1 صفحه بعد

آخرین مطالب

/
از این که به وبلاگ من سر زدید خیلی خیلی ممنونم باتشکر حمیدرضاخوری